AI资讯新闻榜单内容搜索-Deepseek R

刷新复杂Agent推理记录！阿里通义开源网络智能体超越DeepSeek R1，Grok-3

在互联网信息检索任务中，即使是很强的LLM，有时也会陷入“信息迷雾”之中：当问题简单、路径明确时，模型往往能利用记忆或一两次搜索就找到答案；但面对高度不确定、线索模糊的问题，模型就很难做对。

来自主题: AI技术研报

7360 点击 2025-07-08 11:05

Jack Clark: 美国 AI 政策的隐形推手，时代的良心还是囚徒？

Jack Clark 是最关注和熟悉中国在芯片、计算和模型上进展的 AI Lab 领导人之一。他毫不吝啬对中国 AI 进展的认可，将 DeepSeek R1 视作“推理模型大范围扩散”的起点，近期又把 HyperHetero 使用的异构集群叫做通过“超级智能进行持续自我训练”的垫脚石。

来自主题: AI资讯

7374 点击 2025-07-05 19:50

野生DeepSeek火了，速度碾压官方版，权重开源

没等来 DeepSeek 官方的 R2，却迎来了一个速度更快、性能不弱于 R1 的「野生」变体！这两天，一个名为「DeepSeek R1T2」的模型火了！这个模型的速度比 R1-0528 快 200%，比 R1 快 20%。除了速度上的显著优势，它在 GPQA Diamond（专家级推理能力问答基准）和 AIME 24（数学推理基准）上的表现均优于 R1，但未达到 R1-0528 的水平。

来自主题: AI资讯

8667 点击 2025-07-04 22:18

新“SOTA”推理模型避战Qwen和R1？欧版OpenAI被喷麻了

“欧洲的OpenAI”Mistral AI终于发布了首款推理模型——Magistral。然而再一次遭到网友质疑：怎么又不跟最新版Qwen和DeepSeek R1 0528对比？

来自主题: AI资讯

8643 点击 2025-06-11 14:23

视频生成1.3B碾压14B、图像生成直逼GPT-4o！港科&快手开源测试时扩展新范式

测试时扩展（Test-Time Scaling）极大提升了大语言模型的性能，涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么，什么是视觉领域的 test-time scaling？又该如何定义？

来自主题: AI技术研报

7466 点击 2025-06-10 16:18

大模型强化学习新突破——SPO新范式助力大模型推理能力提升！

当前，强化学习（RL）在提升大语言模型（LLM）推理能力方面展现出巨大潜力。DeepSeek R1、Kimi K1.5 和 Qwen 3 等模型充分证明了 RL 在增强 LLM 复杂推理能力方面的有效性。

来自主题: AI技术研报

7410 点击 2025-06-09 11:02

斯坦福临床医疗AI横评，DeepSeek把谷歌OpenAI都秒了

斯坦福最新大模型医疗任务全面评测，DeepSeek R1以66%胜率拿下第一！

来自主题: AI技术研报

4638 点击 2025-06-04 11:02

MiniMax正暗戳戳憋大招

MiniMax即将发布代号M+的文本推理模型，其表现将影响公司未来竞争力。面对DeepSeek R1的冲击，MiniMax采取国内C端不接入、海外接入的策略，并推出类Manus产品MiniMax Agent。公司通过品牌拆分（海螺AI更名）、纯API商业模式拓展市场，语音模型商业化效果显著，但未进入“基模五强”名单。新推理模型或成其保持行业地位的关键。

来自主题: AI资讯

8752 点击 2025-06-03 00:16

玩完 DeepSeek R1 新版，外国网友又「蚌埠住了」？

几天前，没有预热，没有发布会，DeepSeek 低调上传了 DeepSeek R1（0528）的更新。

来自主题: AI资讯

7872 点击 2025-06-02 16:10

重新定义「小版本」！全面实测新版 DeepSeek R1，我们挖出了这些隐藏亮点

DeepSeek 猝不及防地更新了，不是 R2，而是 R1 v2。

来自主题: AI资讯

8340 点击 2025-05-29 17:09